全原子和粗粒分子动力学是两个广泛使用的计算工具,用于研究蛋白质的构象状态。然而,这两种仿真方法遭受了这样的事实,即在没有获得超级计算资源的情况下,难以实现这些状态的时间和长度尺度。这种方法的一种替代方法是基于编码分子动力学的原子轨迹作为没有物理粒子的速记版本,然后学习通过使用人工智能来传播编码的轨迹。在这里,我们表明,作为Ramachandran盆地类的向量,分子动力学轨迹框架框架的简单文本表示保留了蛋白质在每个帧中的完整原子代表的大多数结构信息,并且可用于生成无原子轨迹适用于训练不同类型的生成神经网络。反过来,训练有素的生成模型可用于无限期地扩展无原子动力学,或在潜在的模型中从其表示中采样蛋白质的构象空间。我们将这种方法定义为没有分子的分子动力学,并表明它可以涵盖与传统分子动力学难以访问的蛋白质的物理相关状态。
translated by 谷歌翻译
由于深度学习模型通常包含数百万可培训的权重,因此对更有效的网络结构具有越来越高的存储空间和提高的运行时效率。修剪是最受欢迎的网络压缩技术之一。在本文中,我们提出了一种新颖的非结构化修剪管线,基于关注的同时稀疏结构和体重学习(ASWL)。与传统的频道和体重注意机制不同,ASWL提出了一种有效的算法来计算每层的层次引起的修剪比率,并且跟踪密度网络和稀疏网络的两种权重,以便修剪结构是同时从随机初始化的权重学习。我们在Mnist,CiFar10和Imagenet上的实验表明,与最先进的网络修剪方法相比,ASWL在准确性,修剪比率和操作效率方面取得了卓越的修剪。
translated by 谷歌翻译
对从FFPE组织块制备的载玻片上切割的染色组织的光学显微镜检查是组织诊断的金标准。此外,任何病理学家的诊断能力和专业知识都取决于他们在常见和稀有变体形态上的直接经验。最近,深度学习方法已被用来成功显示此类任务的高度准确性。但是,获得专家级注释的图像是一项昂贵且耗时的任务,人为合成的组织学图像可能会非常有益。在这里,我们提出了一种方法,不仅可以生成组织学图像,从而重现普通疾病的诊断形态特征,而且还提供了产生新的和罕见形态的用户能力。我们的方法涉及开发一种生成的对抗网络模型,该模型综合了由类标签约束的病理图像。我们研究了该框架合成现实的前列腺和结肠组织图像的能力,并评估了这些图像在增强机器学习方法的诊断能力以及通过一组经验丰富的解剖病理学家的可用性方面的实用性。我们的框架生成的合成数据在训练深度学习模型中进行了类似于实际数据进行诊断。病理学家无法区分真实图像和合成图像,并显示出相似的前列腺癌分级的观察者间一致性。我们扩展了从结肠活检中显着复杂图像的方法,并表明也可以再现了此类组织中的复杂微环境。最后,我们介绍了用户通过简单的语义标签标记来生成深层组织学图像的能力。
translated by 谷歌翻译
我们通过与与前面令牌的局部相似度,通过调节从大语料库检索的文档块来增强自动回归语言模型。尽管使用25美元\时分,我们的检索增强型变压器(RetroCro)的检索增强型变压器(RetroCr)对GPT-3和侏罗纪-1获得了可比性的性能。微调后,复古表演转换为下游知识密集型任务,如问题应答。复古结合了冷冻BERT猎犬,一种可微分的编码器和块状的横向机制,以预测基于数量级的令牌,而不是训练期间通常消耗的数量。我们通常从头开始训练复古,还可以快速改造预先接受的变压器,通过检索,仍然达到良好的性能。我们的工作通过以前所未有的规模开辟了通过显式内存改进语言模型的新途径。
translated by 谷歌翻译
嵌入或可视化临床患者数据的主要挑战是可变类型的异质性,包括连续实验室值,分类诊断代码以及缺失或不完整的数据。特别地,在EHR数据中,一些变量是{\ EM缺失而不是随机(MNAR)}但故意没有收集,因此是信息来源。例如,在疑似诊断的基础上,某些患者可能认为实验室测试是必要的,但不适用于其他患者。在这里,我们呈现壁画林 - 一个无监督的随机森林,用于代表具有不同变量类型的数据(例如,分类,连续,mnar)。壁画森林由一组决策树组成,其中随机选择节点分裂变量,使得所有其他变量的边缘熵由分裂最小化。这允许我们在与连续变量一致的方式中也拆分在Mnar变量和离散变量上。最终目标是学习使用这些患者之间的平均树距离的患者的壁画嵌入。这些距离可以馈送到非线性维度减少方法,如phate,以获得可视化的嵌入。虽然这种方法在连续值的数据集中普遍存在(如单细胞RNA测序)中,但它们尚未在混合可变数据中广泛使用。我们展示在一个人工和两个临床数据集上使用我们的方法。我们表明,使用我们的方法,我们可以比竞争方法更准确地对数据进行可视化和分类数据。最后,我们表明壁画也可用于通过最近提出的树木切片的Wassersein距离比较患者的群组。
translated by 谷歌翻译
鉴于自然语言陈述,如何验证其对维基百科这样的大型文本知识来源的准确性吗?大多数现有的神经模型在不提供关于哪一部分错误的情况下出现问题的情况下会进行预测。在本文中,我们提出了Loren,一种可解释的事实验证的方法。我们分解了在短语级别的整个索赔的验证,其中短语的真实性用作解释,可以根据逻辑规则汇总到最终判决中。 Loren的关键洞察力是将索赔词如三值潜变量代表如下,由聚合逻辑规则规范化。最终索赔验证基于所有潜在的变量。因此,Loren享有可解释性的额外好处 - 很容易解释它如何通过索赔词来达到某些结果。关于公共事实验证基准的实验表明,Loren对以前的方法具有竞争力,同时享有忠实和准确的可解释性的优点。 Loren的资源可用于:https://github.com/jiangjiechen/loren。
translated by 谷歌翻译